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(54) Title: PROBE, NUCLEIC ACID SEQUENCES. METHOD PARTICULARLY SUITABLE FOR DETECTING AND IDENTIFYING 
YEASTS, AND GENETIC TOOI^S THEREFOR 

(54) Titre: SONDE, SEQUENCE NUCLE1QUES ET PROCEDE NOTAMMENT, DE DETECTION ET D ' IDENTIF1 CATION DE 
LEVURES, DE MEME QUE LES OUTILS GENETIQUES CORRESPONDANTS 


(57) Abstract 

The detection and characterisation of yeasts, particularly those of medical and industrial interest, is disclosed. The aim is to provide 
powerful, reliable and simply and reproducibiy usable DNA probes specific for numerous yeasts. For this purpose, among others, a yeast- 
specific and/or -infraspecinc detection probe is provided which consists of at least one part of at least one DNA and/or RNA fragment F 
from rDNA that does not code for rRNA synthesis and is located in the IGR (rDNA 25S and rDNA 18S). This iterative rDNA includes 
at least two repeated subsequences with a mutual homology of £ 50 %. A detection method using said probe, as welt as nucleic acid 
sequences capable of being included in the probe, are also disclosed. Said probe is useful for detecting/identifying yeast (e.g. C krusei. G. 
candidum), as an epidemiological marker or strain tracer, and in anti-yeast therapy. 

(57) Ahi-egl 

Le domaine de l'invention est celui de la detection et la caractensation de levures notarament celles d*int£n*t medical et industriel. 
Le but vise* par l'invention est la foumiture de sondes nucl&ques specifiques de nombreuses levures, et par ailleurs perform antes, fiables 
et utilisables de maniere simple et reproductible. Pour satisfaire a ce but parmi d'autres, l'invention propose ainsi une sonde de detection 
specifique et/ou infraspecifique de levure, caract6risee en cc qu'ellc est constitute par au moins une partie d'au moins un fragment F d'ADN 
et/ou d'ARN, provenant d'ADNr qui ne code pas pour la synthase d'ARNr et qui est localise dans 1'IGR (ADNr 25S et ADNr 18S), Cet 
ADNr est de type iteratif comprend au moins deux sous-sequences rep&ees, avec une homologie entre sous-sequences £ a 50 L'invention 
conceme en outre un precede' de detection mettant en oeuvre cette sonde, ainsi que des sequences nuclelqucs susceptibles d'etre incluses 
dans la sonde. Applicaton: detection/identification de levure {C.krusei. G.candidumt) par exemple, marqueur epidemiologique, traceur de 
souches, thlrapeutique an ti- levures. 
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SONDE, SEQUENCE NUCLEIQUES ET PROCEDE NOTAMMENT, DE DETECTION ET 

D' IDENTIFICATION DE LEVURES, DE HEME QUE LES OUTILS GENET IQUES CORRESPONDANTS 


5 DOMAINE TECHNIQUE : 

La presente invention concerne la detection et la caractfrisation de levures. En 
particulier elle foumit des sondes specifiques, notamnient nucleiques, et un modele de 
developpement des dites sondes pour la detection et T en particulier, Identification et 
10 le typage (caracterisation infra-specifique) des souches de levures de differentes 
especes d'interet medical et industriel. 

ART ANTERTEUR : 

15 Les levures sont des champignons, micro-organsimes eucaryotes, chez lesquels 

la forme unicellulaire est predominante (Barnett J, W., R., W. Payne and D. Yarrow., 
"Yeasts characteristics and identification, 2nd Edition, Cambridge university press, 
Cambridge, 1991). Elles sont divisees en genres (e.g. Candida) et especes (e.g. 
Candida krusei) sur la base de criteres de reproduction sexuee (lorsqu'elle existe), 

20 morphologiques, physiologiques, chimiotaxonomiques et moleculaires. 

Les levures sont ubiquitaires. Generalement leur innocuite est bien etablie Elles 
sont souvent utiltsees comme agent de transformation (auxiliaires technologiques) 
dans les proced^s agro-alimentaires, mais certaines sont parfois pathogenes. Les 
levures sont generalement considerees comme etant des pathogenes opportunistes. 

25 Les levures pathogenes opportunistes interessent le domaine de la mycologie 

medicale. Ces levures sont responsables d'infection superficielles, cutanees, sous- 
cutanees, et systemiques. Ces dernieres sont les plus serieuses en raison des taiix de 
mortalite eleves qui leur sont imputes. Les levures pathogenes appartiennent le plus 
souvent au genre Candida. Parmi ce genre les especes plus particulierement 

30 importantes sont Candida albicans, Candida krusei, Candida tropicalis, Candida 
lusitaniae, Candida (Torulopsis) glabrata. Les infections qu'elles provoquent sont 
appelees "Candidoses". 

La prevalence et la pathogenetic de ces levures opportunistes sont elevees 
chez les sujets immunodeprimes, notamment chez les patients neutropeniques, atteints 

35 de SID A, cancereux, etc... 
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Toute la difficult* du traitement de ce type infections, provient du fait que 
certaines especes sont resistances a certains antifongiques, notamment au fluconazole 
(eg C krusei C glabrata). En outre, pour une meme espece certaines souches 
presentent un caractere de resistance alors que d'autres sont sensibles aux 
5 antifongiques considers (e.g. C albicans, C. lusitaniae). 

En consequence, une detection rapide et une identification precise et fiable amsi 
qu'un typage des souches de ces especes sont de plus en plus necessaires, notamment 
pour permettre la mise en place d'un traitement antifongique appropne. II existe, en 
outre un reel besoin en marqueurs epidemiologiques fiables, a des fins d'etudes 
10 epidemiologiques dans le domaine medical, ou de tracage des souches dans les 
industries agroaiimentaires ou de fermentation. 

Mais force est de constater que, les methodes classiques dldentification des 
levures ne donnent pas entiere satisfaction a tous ces egards. 

On connait ainsi notamment celles decrites par Barnett I., W., R. W. Payne and 
15 D Yarrow dans "Yeasts characteristics and identification", 2nd Edition, Cambndge 
university press, Cambridge 1991, qui necessitent un isolement prealabie du micro- 
organisme en culture pure, puis I'etude de ses caracteristiques morphologies et 
surtout physiologiques (plus de 80 tests), 1'ensemble de ces operations requerant de 
10 a 30 jours pour une identification. Ces methodes sont done fast.d.euses et 
20 particulierement longues. Elles sont reservees aux laboratoires de reference et 
inutilisables en pratique courante. _ 

Plus rapide et plus rationnelles, les methodes miniaturisees et standardisees 
identification des levures importance medicale, comprennent cependant toujours 
un isolement prealabie puis une identification du micro-organisme a l'aide de tests 
25 physiologiques, realises par exemple a laide de galeries. La duree de tels tests est 
d'environ 5 jours pour aboutir a une identification. De plus ces techruques donnent 
parfois des nisultats equivoques. Des especes telles que C. Krusei, C. inconspicua, C. 
lipolytics C. norvegemis, C rugosa et C. valida sont parfois, voire meme souvent, 

confondues. . ... , 

30 Avec le progres de la bioiogie moleculaire, une nouvelle technology unhsant le 

Principe d'hybridation ADN-ADN ou ADN-ARN s'est developpee pour la m.se au 
point des tests d'identification rapides, sensibles et specifies. Le materiel genet.que 
des micro-organismes presents dans l'echantillon est decele directement a 1'a.de de 
sondes nucleiques a ADN ou ARN marque. La detection et Identification peuvent 
3 5 etre realisees simultanement sans isolement prealabie. 
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Les rares methodes decrites d'identification des levures a l'aide de sondes 
nucleiques, presentent I'inconvenient d'etre basees sur des sondes de petites tailles (30 
a 35 nucleotides) qui necessitent la mise en oeuvre d'un marquage radioctif plus 
sensible que le marquage non radioactif mais aussi plus contraignant. 
5 Un autre inconvenient de ces sondes lie a leur taille reduite, s'exprime dans le 

cadre de leur mise en oeuvre dans les techniques de polymerisation en chaine (PCR). 
Ces demieres consistent a amplifier une sequence ADN donnee, en la multipliant a 
partir d'un couple d'amorces et l'aide dSine polymerase. De telles amplifications 
peuvent etre employees dans un but diagnostique, afin de faciliter la detection. Des 
10 lors que ces sondes seraient utilisees comme amorces en PCR cela limiterait les 
possibility de choix des amorces dans une petite sequence de 30 a 35 nucleotides. 

Ces sondes sont generalement dirigees contre des sequences cibles d'ADN 
codant la petite sous unite 18 S de l'ARN ribosomique (ssuARNr). Ces cibles sont 
classiquement choisies car les sequences d'ADN codant les ARN ribosomaux sont les 
1 5 premieres a avoir ete determinees. De meme l'utilisation de la partie 3' des sequences 
codant la grande sous unite 25 S de l'ARN ribosomique (lsuARNr) a ete decrite. II 
existe un probleme lie au choix de sequences codant les ssuARNr ou lsuARNr 
comme cibles. En effet ces sequences ont un caractere universel, c'est-a-dire qu'une 
partie importante d'entre elles est retrouvee chez tous les micro-organismes (levures, 
20 bacteries) ; elles sont dites "hyper-conservees". Le choix des sequences cibles est done 
limitees aux portions limitees variables de ces sequences codantes des ARNr. 

En outre, parmi les sondes decrites dans I'art anterieur, aucune ne permet le 
typage des souches, c'est-a-dire la differenciation des individus au sein de l'espece, ces 
individus etant uniquement assignes a un groupe : e.g. l'espece Candida krusei, 
25 l'espece Candida glabrata, l'espece Candida lusitaniae, etc... En effet, les sondes 
prealablement decrites ne permettent pas un typage des souches au sein des especes 
car elles ne revelent pas suffisamment de polymorphisme de la taille des fragments de 
restriction parmi les souches de ces especes et ainsi ne constituent pas de marqueurs 
epidemiologiques fiables. 
30 A titre d'illustrations de telles sondes connues et repondant imparfaitement aux 

besoins techniques existant en la matiere, on peut citer : 

• les sondes oligonucleotidiques developpees par la societe Genetrak 
Systems et dirigees contre des sequences de 30 (probes 1351), 33 (probe 1537) et 35 
(probe 1530) nucleotides de 1'ADN codant l'ARN ribosomal 18 S. Ces sondes sont 
35 decrites dans la demande de brevet europeen N° 0 422 869. Elles ont ete testees 
contre 4 souches de Candida krusei. II est a noter qu'il n'est pas fait etat dans les 
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exemples de cette demande, de detection de Candida krusei par hybridation dans les 
prelevements de sang humain, crachats ou liquide cephalorachidien. Par ailleurs, ces 
sondes ne permettent pas de different les souches entre dies au sein de l'espece 
Candida krusei. 

5 . la sonde decrite par Niesters et collaborateurs (Niesters et al., 1993, 

Rapid polymerase chain reaction-based identification assays for Candida species. J. 
Clin Microbiol., 31, 904-910) 1993). II s'agit d'une sonde de 20 nucleotides 
(oligonucleotide 705) dirigee contre une sequence specifique du produit 
^amplification de la petite sous unite d'ARN ribosomal (ssuARNr). Cette etude est 
10 utilisee dans une methode d'identification des especes du genre Candida basee sur 
^amplification en chaine (PCR) de sequences du gene codant la ssuARNr, puis le 
sequencage direct de ces sequences. Cette methodologie conceme, la encore, l'ARN 
ribosomal Elle presente l'inconvenient de necessiter un sequencage direct du produit 
d'ampUfication, technique qui n'est accessible qu'a un nombre limite de laborato.res de 
15 recherche et surement pas applicable en routine. De plus, d'apres les auteurs, 
l-oligonucleotide 705 ne permet pas une amplification specifique de l'ADN de Candida 
krusei. Les sondes decrites par Niesters et collaborateurs ne permettent pas elles non 
plus de typer les souches de Candida krusei. 

On connait egalement, notamment au travers de Varticle red.ge par BALEIRAS 
20 COUTO et al - Applied & Environmental Microbiology, Jan. 1996 p.41-46 
"Evaluation of molecular typing techniques to assign genetic diversity among 
Saccharomyces cerevisiae strains". Cet article divulgue la discrimination de souches a 
1'interieur de l'espece Saccharomyces cerevisiae, par recours aux techniques 
d'identification du type de celles faisant intervenir des fragments dADN 
25 polymorphiques amplifies de maniere aleatoire (RAPD) et du type reaction de 
polymerisation en chaine (PCR) a Vaide d'amorces nucleotides. Les fragments 
obtenus par ces techniques sont ensuite soumis a des digestions a l'aide d'enzyme de 
restriction. Toutes les sequences et fragments ainsi obtenus sont testes dans 
identification infraspecifique de 16 souches difterentes de Saccharomyces cerevmae. 
30 La RAPD et la PCR ont permis de reconstituer les regions d'espacements 
intergeniques transcrites (IGR - ITS) et les regions intergeniques non transcntes IGR 
. NTS) de cistrons d'ADNr codant pour la synthese d'ARN ribosomique (ARNr). Ce 
document ne decrit nullement le contenu des sequences reconstitutes par RAPD et 
PCR dont la longueur est d'ailleurs d'au moins 7 kbases (kb). Cet article enseigne qud 
35 n'existe pas de polymorphisme significatif entre les souches de Saccharomyces 
cerevisiae A. Dans le meilleur des cas (correspondant a celui ou Von utilise des Taq\\ 
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il n'est possible de discriminer que 6 souches sur 16. Ce resultat est tout-a-fait 
perfectible. 

Par ailleurs, BALEIRAS COUTO et al incitent plutot le lecteur a s'interesser aux 
regions intergeniques d'espacement transcrite (ITS), pour la differencials 

5 infraspecifique de levure. II presente ces regions intergeniques transcrites comme 
etant plus appropriees que les regions intergeniques non transcrites (NTS). 
En outre, les amorces (Primers) utilisees dans la technique de (PCR) preconisees dans 
ce document, ne fonctionnent pas de facon universelle sur toutes les especes de 
levures, ceci constitue un facteur limitatif de la technique. En particulier les auteurs 

1 0 indiquent que I'amplification n'a pas ete possible pour les especes C. valida, C. krusei, 
Z bailii , ou Z rowcii. 

II apparait done que les techniques decrites dans cet article ne conviennent que pour 
du typage infraspecifique de levure et notamment pas pour I'identification d'especes de 
levure. 

15 La demande de brevet Internationale WO 95/11 991 decrit une sonde et un 

procede de detection des levures de l'espece C krusei. Les outils genetiques 
constituant cette sonde sont formes par un fragment d'ADN et/ou d'ARN de taille 
comprise entre 7 et 4 kb, hybridant specifiquement avec l'ADN et/ou TARN de 
Candida krusei et ne codant pas pour TARN ribosomal (ARNr). 

20 Sont egalement compris dans ces outils genetiques, les produits de transcription et de 
traduction du susdit fragment, de meme que les associations entre ces differents outils. 
Cette demande de brevet ne divulgue pas la structure des fragments d'ADN mis en 
oeuvre dans cette sonde. Le moyen de caracterisation utilise pour ces fragments, est 
forme par leur carte de restriction enzymatique. L'espece de levure exclusivement 

25 concernee par ce document est Candida krusei. 

La demande PCT WO-A-93 23 568 (A.R. HOLMES et al) conceme des 
methodes de diagnostic des infections fongiques, selon lesquelles on met en oeuvre 
des sondes nucleiques issues de fragment d'ADN provenant exclusivement de C. 
albicans et exclusivement applicables a cette espece de levure. Dans cette demande 

30 de brevet, on preconise de maniere preferee la mise en oeuvre d'une sonde EOB2 
constituee par tout ou partie d'une sequence nucleotidique, comprise dans le gene 
d'ADNr codant pour la sous-unite d'ARNr 5S. Cette sequence d'ADNr comprend 121 
paires de bases localisees entre le nucleotide 937 et le nucleotide 1057 de la SEQ ID 
NO : 1 du gene d'ADNr 5S, divulguee dans cette demande PCT. 
35 Secondairement, le WO-A-93 23 568 decrit une sonde EOB 1 localisee dans la region 
intergenique non transcrite (IGR-NTS), situee entre le gene d'ADNr codant pour 
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15 


l'ARNr 5S et le gene d'ADNr codant pour I'ARNr 18 S. Cette sonde EOB1 s'hybride 
avec une sequence d'ADNr comprise entre !es nucleotides 1 et 936, de preference 1 et 
710delaSEQIDNO: 1. 

Dans le cas ou elles sont de faible longueur, ces sondes EOB2 et EOB1 peuvent etre 
amplifies par PCR amorces PS pA„ PS pA 2 , PCon,, PCon 2 . 
La sonde EOB2 comprise dans 1'ADNr 5S permet la detection des levures 
pathogenes, tandis que la sonde EOB1 est presentee comme etant interspecifique. En 
tout etat de cause, il est clair que le WO-9323568 ne fait nullement mention de 
distinction infxa-specifique des souches des differentes especes de levures citees 
(C. Means, C. krusei, etc). La sonde EOBl n'est pas une sequence source de 
stucture particuliere, comme e.g. de type iterative comprenant plusieurs sous- 
sequences repetees homologues entre elles. 

Le WO-93 23 568 ne divulgue done pas, de structure genique typique ^identification 
et de detection inter et infraspecifique. 

BREVE DESCRIPTION DE L' INVENTION : 


Dans cet etat de la technique, run des objectifs essentiel de la presente invention 
est de fournir une sonde de detection et ^identification specifique et/ou 
20 infraspecifique de levure, a vocation universelle dans le domaine des levures. 

Un autre objectif essentiel de Invention est de fournir une sonde, notamment 
nucleique, qui permette a la fois une detection specifique et une identification infra 
specifique de levure, de maniere performante, fiable et reproductible. 

Un autre objectif de invention est de fournir une sonde, notamment nucleique, 
25 qui soit de taille suffisante pour autoriser l'utilisation d"un marqueur, autre que 
radioactif et done de mise en oeuvre plus commode. 

Un autre objectif de Invention est que cette sonde nucleique soit dirigee contre 
des sequences cibles d'ADN different de celui codant pour des petites sous-unites 5,8 
S ou 18 S d'ARN ribosomique, qui sont globalement peu representatifs de Vespece, 
30 car tres conservees chez les micro-organismes. 

Un autre objectif de Invention est que cette sonde puisse etre utilisee dans des 
milieux complexes biologiques du type sang humain, crachat, ou liquide 
cephalorachidien. 

Un autre objectif essentiel de 1'invention est de fournir une sonde notamment a 
3 5 Candida krusei qui permette de depasscr la simple detection d'especes pour acceder a 
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^identification precise et au typage des levures au sein meme de l'espece Candida 
krusei. 

Un autre objectif essentiel de Tinvention est de fournir une sonde notamment a 
Geotrichum candidum qui permette de depasser la simple detection d'especes pour 
5 acceder a 1'identification precise et au typage des levures au sein meme de l'espece 
Geotrichum candidum. 

Un autre objectif essentiel de invention est de fournir une sonde de detection 
de levure qui soit composee d'outils genetiques du type sequence d'ADN et/ou d'ARN 
parfaitement identifiee et reproductible. 
10 Un autre objectif essentiel de l'invention est de fournir une sonde de detection 

de levure qui soit significativement performante pour Identification inter et 
infraspecifique d'un suflBsamment grand nombre de levures, pour pouvoir etre 
economique viable. 

Un autre objectif essentiel de la presente invention est de fournir un procede de 
15 detection et d'identification inter/infraspecifique de levures qui soit simple, non delicat 
et economique a mettre en oeuvre et dans lequel on a recours a la sonde sus-visee. 

Un autre objectif essentiel de 1'invention est de fournir une sonde applicable 
notamment a la detection specifique a Identification infraspecifique de levure mais 
egalement comme marqueur epidemiologique, comme traceur de souches, ou dans le 
20 cadre d'une strategic therapeutique visant les affections a levure, entre autres. 

Ces objectifs, et d'autres encore, sont atteints par la presente invention qui 
concerne une sonde, notamment, de detection specifique et/ou intraspecifique de 
levures, du type de celle choisie parmi les outils genetiques (ou apparentes) suivants : 


- au moins une partie : 


25 


d'au moins un fragment F d'acide nucleique ADN et/ou 
ARN recopie, constnait et/ou isole a partir d*au moins 
une sequence-source d'ADN ribosomal (ADNr) : 
— > ne codant pas pour la synthese d*ARN ribosomal 


30 


(ARNr), 

et localisee dans la region d*espacement 


intergenique (IGR) non transcrite (NTS) et 
comprise entre TADNr codant pour la sous-unite 
25 S d'ARNr, et 1'ADNr codant pour la sous- 


35 


unite 18 S d'ARNr, 
et/ou d'au moins un analogue Fa de ce fragment, 
resultant de la degenerescence du code genetique ; 
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* et/ou d'au moins un fragment Fc d'ADNc 
complementaire du fragment F, 
- au moins une partie des produits de transcription primaire du 
fragment F et/ou Fa et/ou Fc. 
5 - et une association des outils enumeres ci-dcssus. 

caracterise en ce que la sequence-source d'ADNr pour F et/ou Fa 
et/ou Fc est selectionnee de telle sorte 

> qu'elle soit iterative 

> qu'elle comprenne au moins 2, de preference de 
10 2 a 12 sous-sequences repetees, 

> et que le degre dliomologie entre ces sous- 
sequences soit supcrieur ou egal a 50 %, de 
preference 55 %, et plus preferentiellement 
encore a 60 %. 


15 


DESCRIPTION DETA1LLEE DE L'INVENTION : 


II est done du merite des inventeurs cites dans la presente demande d'avoir pu 
isoler et caracteriser un certain nombre de fragments F d'acide nucleique ayant une 
20 structure tout-a-fait particuliere et qui de facto, constitue une veritable empreinte 
digitale non seulement dtoe espece donnee de levure mais egalement des differentes 
souches contenues dans cette espece. Le merite des inventeurs est d'autant plus grand 
que l'isolement et la caracterisation desdits fragments a ete realise au sein des zones 
d'espacement intergenique non transcrites de cistrons ribosomaux, alors qu'il existaH 
25 un courant scientifique, Ulustre notamment par l'article de BALEIRAS COUTO et al vise 
ci-dessus, selon lequel il semblait preferable et recommande de s'interesser aux regions 
transcrites des genes ribosomaux pour la detection et l'identification de levures. 

II releve egalement du merite des inventeurs d'avoir propose des outils 
genetiques ou apparentes constitues par les susdits fragments pour la detection et 
30 l'identification inter-espece de levures, de meme que pour la mise en evidence 
infraspecifique (discrimination des levures d'une espece donnee) et, en particulier. sans 
que cela ne soit limitatif, des especes Candida krusei et Geotrichum candidum 

Les fragments F, Fa, Fc d'acide nucleique selon I'invention ont pour 
caracteristique origmale et avantageuse d'etre non transcrits et de comprendre un ou 
35 plusieurs modules sequentiels de bases nucleiques (denommes egalement sequences- 
sources iteratives dans le present expose) comportant chacun une ou plusieurs sous- 
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sequences repetees qui sont des copies tres proches les unes des autres. Cest ou ce 
sont ces modules qui constituent un ou plusieurs motifs primaires utiles pour la 
detection/identification inter et infraspecifique d'une pluralite de levures. 
Le nombre de bases nucleotidiques de ces modules ou sequences-sources varient dans 
5 une espece a l'autre, mais on retrouve cette organisation similaire recurrente dans de 
multiples especes de levures. 

Sans vouloir etre lie par la theorie, il semble que le moyen ^identification 
infraspecifique des sondes conformes a l'invention, puisse etre fonde sur le 
polymorphisme qui, au sein d'une espece donnee de levure, decode du nombre de 

10 sous-s6quences dans les modules ou sequences-sources iteratives, ou entrant dans la 
constitution des fragments F, Fa, Fc des sondes selon invention. 

Suivant un premier mode de realisation de l'invention, premier mode qui est 
d'ailleurs prefere, la sequence-source de F est localisee dans la region d'espacement 
intergenique 2 (IGR 2 ) non transcrite (NTS) et comprise entre 1'ADNr codant pour la 

15 sous-unite 5S d'ARNr et l'ADNr codant pour la sous-unite 18 S d'ARNr (Cf Fig.2 
annexee). 

Selon une variante avantageuse du premier mode de realisation de l'invention, la 
sequence-source iterative de F correspond a une sequence Fa et comprend au moins 
trois sous-sequences repetees comportant chacune au moins 80, de preference au 
20 moins 120 et plus preferentiellement encore entre 1 50 et 300 bases nucleotidiques. 

En pratique, la sequence-source Fa comprend entre 3 et 10 sous- sequences repetees 
comprenant entre 150 et 250 bases nucleotidiques. 

De preference, les sequences-sources iteratives de F et, en particulier Fa, de la 
sonde selon l'invention comprennent chacune au moins une sous-sequence de 
25 longueur tronquee par rapport aux autres sous-sequences, cette sous-sequence 
tronquee etant de preference terminate. 

S'agissant de la sequence-source iterative Fa, il est a considered sans pour 
autant vouloir etre Ite par la theorie, que le nombre de sous-sequences repetees 
elementaires determine le polymorphisme au sein d\ine meme espece de levures. Cela 
30 pourrait r^sulter tfune replication (duplication d*une ou plusieurs des sous- sequences 
repetees). Le tronc commun structurel entre les differentes souches d'une meme 
espece tient a une similitude dans l'organisation des repetitions de chaque sous- 
sequence. 

Les phenomenes de replication (duplication) a Torigine du polymorphisme entre 
35 souches sont lies a des recombinaisons, dont Teventuelle sequence tronquee terminate 
evoquee ci-dessus, serait le reflet. 
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Toujours dans le cadre du mode prefere de mise en oeuvre de 1'invention, selon 
lequel la sequence source F est dans l'IGR,, il est prevu, conformement a une autre 
variante avantageuse, que la sequence-source iterative de F correspond a une 
sequence Fp et comprend au moins trots sous-sequences repetees comportant 
5 chacune au moins 4, de preference au moins 6 et, plus preferentiellement encore entre 
7 et 25 bases nucleotidiques, chaque sous-sequence comprenant au moins un motif 
commun (Com 1) a toutes les sous-sequences et ayant une longueur inferieure ou 
egale a celle de la sous-sequence a laquelle il appartient. 

En pratique, ces sequences-sources F(5 comprennent chacune 8 a 12 sous-sequences 
10 repetees comportant individuellement entre 7 et 13 bases nucleotidiques. 

Conformement au deuxieme mode de realisation de la sonde selon Invention, la 

sequence source de F : 

. est localise* dans la region d'espacement intergenique 1 (IGR,) non transcnte 
(NTS) et comprise entre I'ADNr codant pour la sous-unite 5S d'ARNr et I'ADNr 

15 codant pour la sous-unite 25 S d'ARNr 

• et correspond a au moins une sequence F 7 et comprend au moins trois sous- 
sequences repetees comportant chacune au moins 4, de preference au moins 5 et, plus 
preferentiellement encore entre 5 et 50, voire entre 5 et 45 et mieux encore entre 5 et 
40 bases nucleotidiques, chaque sous-sequence comprenant au moms un motif 
20 commun (Com 2 ou 3) a toutes les sous-sequences et ayant une longueur infeneure 
ou egale a celle de la sous-sequence a laquelle il appartient. 

un cas de figure particulierement prefere etant celui dans lequel F correspond a 
au moins deux sequences F 7 : Fy, et F 7j ayant respectivement avantageusement de 5 a 
20 et de 9 a 25 bases nucleotidiques. 
25 Selon un autre de ces aspects, la presente invention concerne egalement des 

sequences d'ADN, de preference ribosomique (ADNr), susceptibles de corresponds 
aux fragments F sus-evoques : Fa, Fp, Ft, F 7l et F 7j , ou susceptibles de contemr tout 
ou partie d'un ou plusieurs desdits fragments F noyes au sein d'une longue sequence 
nucleique, de preference d'ADNr. 
30 La presente invention a done ainsi egalement pour objet une sequence d'ADNr 

caracterisee en ce qu'elle est choisie dans le groupe des sequences annexees suivantes 
:SEQIDNO:l:;SEQIDNO:2:;SEQIDNO:3:;SEQIDNO:4.;SEQID 

NO : 5 : ; les SEQ ID NO : 2 : a : 5 . etant particulierement preferes. 

En l'occurrence, la SEQ ID NO : 1 annexee contient toutes les SEQ ID NO 2 

35 a5 : 

- SEQ ID NO : 2 : — » base N 2256 a base 3512 
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- SEQ n> NO 

- SEQ ID NO 
SEQ ID NO 


3 : -4 base N 4823 a base 4903 
:4:->baseN 923 a base 1011 
5 : -»baseN 1012abase 1151 
Selon un exemple particulier d'illustration de I'invention, la sonde qu'elle 
5 concerne est caracterise en ce que : 

Fa correspond a SEQ ED NO : 2 : 
FP correspond a SEQ ID NO : 3 : 
F?i correspond a SEQ ED NO : 4 : 
Fv 2 correspond a SEQ ED NO : 5 : 
1 0 Cet exemple de realisation correspond a une souche de Candida krusei. 

Suivant une disposition ou une modalite interessante de Invention, la sonde 
decrite ci-dessus est caracterisee 

- en ce qu'elle comprend au moins une partie d'au moins 1'un des fragments Fa, 
Fp\ F7j, Fy 2 , le fragment Fa etant particulierement prefere. 

15 - en ce qu'elle est appliquee : 

> a la detection/identification specifique et infraspecifique de levures, 

> ou comme marqueur epidemiologique, 

> ou encore comme traceur de souche, 

t> ou bien enfin dans le cadre d'une strategic therapeutique visant des 

20 affections a levures. 

S'agissant de l'origine des sequences d'acides nucleiques typiques, conformes a 
rinvention, on a vu qu'eUes sont naturelles puisqu'issues a la base du genome de 
souches de levures. 

Mais il va de soi qu'il est tout a fait a la portee de rhomme du metier, de 
25 preparer des sequences nucleiques « non naturelles » en recopiant les sequences par 
exemple selon les principes du clonage ou de la reaction de polymerisation en chaine 
(PCR), ou par voie de synthese. Notamment, on peut synthetiser des sequences 
nucleiques i I'aide d'appareils de synthese automatiques, tels que ceux commercialises 
par Applied Biosystems. 
30 Aussi, dans tout le present expose les termes fragments ou sequences 

nucleiques, designent aussi bien ceux de type synthetique, que ceux de type naturel. 

Dans le cadre de 1'application en detection / identification, les fragments F, Fa et 
Fc sont utilises comme sonde selon le principe d'hybridation ADN-ADN ou ADN- 
ARN. Une sonde constituee de tels fragments permet la realisation de tests de 
35 detection et ^identification rapides, sensibles, et interAnfraspecifiques d'une pluralite 
d'especes de levure. En d'autres termes, cette sonde peut notamment constituer un 
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excellent marqueur de typage des souches d'une espece donnee et en particulier de 
Candida krusei ou Geotrichum candidum, ces demieres especes ayant ete 
selectionnees, parmi d'autres, pour servir de suppon a l'exemplification du present 
expose. 

5 II faut considerer que l'hybridation de la sonde nucleique de l'invention avec des 

sequences cibles d'acide nucleique de levure (e.g. C. krusei), peut se faire a l'aide de la 
totalite des fragments F vases ci-dessus mais aussi avec seulement une fraction de tout 
ou partie de ces fragments, dont la taille reste, de preference, superieure ou egale a 5 
Bases, de preference a 10 Bases et, plus preferentiellement encore a 100 Bases. 

10 Une autre des caracteristiques avantageuses de la sonde nucleique selon 

['invention est liee au fait que cette derniere peut etre marquee a l'aide de moyens de 
marquage aptes a reveler l'hybridation. Ces moyens de marquage peuvent etre 
radioactifs ou non. Parmi les marqueurs radioactifs classiques, on peut citer ie P 32 . 
S'agissant des marqueurs non radioactifs, on peut mentionner a titre d'exemples, les 

1 5 enzymes fixes tels que la peroxydase. 

Par ailleurs, la sonde selon l'invention peut eventueUement etre employee 
comme source d'amorces specifiques utilisables dans des reactions de polymerisation 
en chalne CPCR). Ces amorces constituent un autre objet de l'invention. 

Comme cela a deja ete signale, la sensibilite de la sonde selon l'invention est 

20 excellente, de sorte qu'elle est parfaitement adaptee a la detection et/ou au typage de 
levures (e.g. Candida krusei ou Geotrichum candidum) par hybridation en "dot-blot" 
ou en "southern-blot". Cette sensibilite se verifie dans des essais indirects 
d'hybridation (methode des depots, dot-blot, Southem-blot, Northern-blot, technique 
d'hybridation « sandwich ») mais aussi dans des experiences d'hybridation directe in 

25 situ. Ces demieres consistent a faire une empreinte sur filtre, de colonies en croissance 
sur un milieu de culture solide et a amener la sonde d'hybridation directement sur le 
filtre. 

Comme cela ressort du texte supra ainsi que de la revendication 1, la sonde 
selon l'invention est de preference de nature nucleique, c'est-a-dire constitute d'acides 
30 nucleiques du type ADN, ADNc, ARNm ou leurs variants et analogues. Ces acides 
peuvent etre d'origine naturelle ou synthetique. 

11 est interessant de noter que la sonde selon l'invention peut etre employee 
efficacement dans tout milieu complexe, comme peuvent l'etre les milieux 
biologiques : sang, crachat, liquide cephalorachidien, etc. Cela n'interfere nullement 
35 sur ses qualites de detection et ^identification. 
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La presente invention concerne egalement un procede de detection et 
^identification inter et/ou infraspecifique de levure caracterise en ce qu'il consiste a 
mettre en oeuvre au moins une sonde nucleique telle que decrite ci-dessus. 
Ce procede s'inscrit dans le cadre des methodologies connues dans le domaine de la 
5 detection et de Identification genetique des microorganismes. 
De preference, ce procede comprend les etapes suivantes : 

- on extrait l'ADN total genomique des souches a etudier, 

- on soumet eventuellement cet ADN total a une digestion 
enzymatique a l'aide d'au moins une enzyme de restriction, 

10 - on denature l'ADN total eventuellement digere, 

- on met en presence l'ADN total ainsi denature, avec la sonde dotee d'au moins 
un marqueur, de fa?on a realiser Thybridation, 

- on elimine l'ADN et la sonde non hybridfe, 

- et on revele l'hybridation k l'aide du marqueur. 

15 II s'agit d'une technique d'hybridation dans laquelle l'ADN cible du micro-organisme a 
etudier, est soumis a une denaturation, avec ou sans digestion enzymatique prealable. 
Uetape qui suit est celle de reassociation des brins separes d'ADN denature avec la 
sonde pour reformer des appariements de paires de base originaux. 
Lors de cette etape de reassociation, les molecules simple brin de la sonde et de la 

20 cible sont mises en condition plus ou moins favorables pour Tappariement (plus ou 
moins stringentes). Dans des conditions tres stringentes seules les molecules dont les 
sequences sont complementaires pour un grand nombre de bases, s'hybrident pour 
former une molecule double brin. La sonde est alors specifique de la cible, 
Avec une sonde marquee a l'aide d'un element radioactif, tel que le P 32 t ou d'une 

25 enzyme greflfee comme par exemple la peroxydase, Thybridation est aisement revelee 
qualitativement et quantitativement. 

Dans le cas ou la sonde comprend des fragments (sequences) nucleiques 
typiques d'origine naturelle, ceux-ci sont naturellement denatures a Tinstar des cibles 
qu'ils sont susceptibles de detecter. Ce n'est evidemment pas le cas pour des 

30 fragments synthetiques. 

La presente invention vise egalement un reactif de detection/identification de 
levures comprenant au moins une sonde selon Tinvention. 
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APPLICATION INDUSTRIELLE 

II ressort de de ce qui precede que la sonde nucleique selon l'invention ainsi que 
le procede en faisant application, sont parfaitement specifiques des levures (e.g. 
5 Candida krusei ou Geotrichum candidum) et offrent une excellente sensibilite. Cela 
leur ouvre des debouches tout a fait interessants dans les domaines applicatifs de 
Tidentification et du criblage differenciation des souches de differentes especes. 
(diagnostic medical, controles industriels en alimentaire, fermentation. .). 

La sonde et le procede selon l'invention interessent diverses especes de levure 
10 et, en particulier, celles d'interet medical telles que celles du genre Candida ou 
d'interet industriel (agroalimentaire tel que Geotrichum Candidum). 

Outre, la detection qui regroupe Identification et le typage de micro organisme 
de type levure, la sonde selon l'invention pourrait etre appliquee dans le cadre d'une 
strategie therapeutique dirigee a l'encontre des affections a levures. Plus precisement, 
15 cela signifie que les fragments F formant la sonde peuvent etre employes comme 
cibles a atteindre, pour des principes medicamenteux actifs contre les levures. Ce role 
de cible pour medicament pourrait notamment etre tenu par l'ADN ou par ses produits 

de transcription primaire. 

L'emploi de la sonde selon l'invention comme marqueur epidemiologique ou 
20 comme traceur de souches constituent d'autres variantes d'applications de la sonde 
selon l'invention. 

Illustration de la presente invention effectuee ci-apres sur la base de travaux 
realises pour les especes de levures Candida krusei et Geotrichum candidum, mais il 
va de soi que les exemples bases sur Candida krusei et Geotrichum candidum 
25 pourront etre extrapoles aux autres especes de levures et, notamment a celles d'interet 

industriel et medical. 

En tout etat de cause, l'invention sera mieux comprise, d'autres de ses avantages 
et variantes de realisation ressortiront bien, a la lumiere des exemples hon limitatifs 
qui suivent et qui decrivent en reference aux dessins annexes la structure d'une sonde 
30 selon l'invention et en particulier a des fragments F qui la constitue, ainsi que plusieurs 
procedures de detection et d'identification en faisant application. 

DESCRIPTION DES FIGURES : 

35 -la liste des sequences annexee donne la structure des SEQ ID : 1 a 5 : correspondant 
respectivement aux fragements Fl et Fa, Fp\ Fy, et Fy 2 . 
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Le fragment Fl donne le sequenfage de la region intergenique d'espacement (IGR) 
entre I'ADNr 25S et I'ADNr 18 S d'un cistron ribosomal de Candida krusei. 
Les exemples de fragment Fa, F(J t F?, et F7 2 .seront egalement denommes 
respectivement CKRS1/ b / al / a2, dans ce qui suit. 
5 - la Figure 1 annexee represente l'hybridation Southern-blot de Candida krusei 
LMCK31 par des sondes Fl et/ou F2. 

- la Figure 2 est une representation schematique d'un cistron d'ADN ribosomal (ADNr) 
montrant la localisation du fragment Fl dans la region d'espacement intergenique 
(IGR) et, au sein de cette derniere, Texistence des fragments Fa, F|J, (IGR 2 ) de meme 

10 que F?! et F7 2 (IGRj), conformes a Invention. 

- la Figure 3 est une carte de restriction du fragment Fl de la Figure 2. 

- la Figure 4 est une representation schematique de la strategic de sequen9age, en 
correlation avec le fragment Fl de la figure 3. 

- la Figure 5 est une representation schematique dclatte du fragment Fa montre aux 
15 Figures 2 et 3. 

- la Figure 6 donne le sequent age de Fa, en particulier de ses sous-sequences Kre-0 a 
7, en faisant une comparaison entre les differentes sous-sequences. Des etoiles 
representent des bases analogues a celles de la sous-sequence Kre-1. »ivrl« est une 
sequence inversee comprenant 8 bases. «pall» est un Palindrome de 8 bases. 

20 - Les Figures 7A, 7B et 7C sont des representations comparers des sous-sequences 
formant les sequences-sources iteratives Fp, F7, et F7 2 respectivement. 

- les Figures 8A et 8B sont des electrophoreses a champ pulse de chromosomes de C. 
krusei et de C albicans, respectivement avant et apres hybridation avec des sondes 
Fl, 

25 FaetF^F^etF^. 

- la Figure 9A est une photographie d'une separation par electrophorese sur gel 
d'agarose, de fragments d'ADN de souches de differentes especes de levures (1 i 1 1), 
digeres par £ce>RI. 

- la Figure 9B est une hybridation selon Southern d'ADN de differentes especes de la 
30 Figure 9A, illustrant la specificite de la sequence-source iterative Fa (ou CKRS-l) 

utilisee comme sonde. 

- la Figure 10A est une photographie du gel d'electrophorese de FADN de plusieurs 
souches de l'espece Candida krusei. 

- la Figure 10B est une hybridation selon Southern de l'ADN de differentes souches de 
35 C krusei, illustrant le polymophisme mis en evidence lorsque la sequence Fa (ou 

CKRS-l) est utilisee comme sonde. 
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- la Figure 11 montre le resultat de 1'amplification selective en PCR de la region 
comprenant Fa. 

- la Figure 12 est une representation schematique de la Carte de restriction du 
Fragment F 10 forment la sonde A 2 0 27 de Geotrichum candidum. Cette sonde 

5 comprenant un sous-fragment F dont la sequence-source iterative est F5 (region 
variable GCRS-A). 

- la Figure 13 represente un profil d'hybridation (Southern) avec la sonde Aj0 27 
specifique de Geotrichum candidum et developpee selon le mode de la sonde F(Fa, F 
P. FYi. f 72> de Candida krusei. 

10 EXEMPLES 


EXEMPLEI : SEQUENCAGED-UN FRAGMENT Fl D'ADNr DE C. KRUSEI PROVEN ANT DE LA 
DIGESTION DE LA SOUCHE LMCKl PAR ECORI 

15 1 . 1 . La souche LMCK 3 1 a ete isolee dans un prelevement broncho-alveolaire chez un 
patient hospitalise. Cette souche a ete deposee le 22 Octobre 1993 a la CNCM de 
l'lnstitut Pasteur de PARIS sous la reference 1-1372. 

Cette souche LMCK 31 est cultivee sur des milieux de culture du type gel AGAR YM 
(1% glucose, 0,3 % extrait levure, 0,3 % extrait de malt, 0,5 % de pactopeptone) ou 
20 AGAR SM (1% glucose, 1% bactopeptone, 0,1 % MGS0 4 . 7H 2 0, 0,22 % KH 2 P0 4> 
0,1 % K2 HP0 4 , 0,1 % extrait levure). 

I 1 Isolement et clonace d'un fragment El 

Un fragment Fl de longueur approximativement egale a 5,4 kb est isole a partir 
25 (fADN genomique de la souche LMCK31, conformement au protocole decrit dans la 
demande de brevet PCT WO-95 11 991. Le fragment Fl a et* selectionne parmi la 
multitude de fragments produits par la digestion de I'ADN total de LMCK31 par 
£coRI ou par Hinfl. 

Plus precisement on a realise une hybridation "southern blot" en mettant en oeuvre 5 
30 ug d'ADN genomique de Candida krusei LMCK3 1 digere soit par £coRI ou Hind 
puis separe par elertrophorese selon leur taille sur un gel d'agarose (0,8 % m/v). 
L'ADN separe est denature dans le gel par une solution de soude puis neutralise par 
un tampon tris. L'ADN est ensuite transfere sur une membrane en nylon (Amersham 
life science inc., ARLINGTON HEIGHTS, IL) puis hybride avec la sonde contenant des 
35 fragments Fl et F2 correspondant a 11GR1 et 2 d'ADNr ou avec des plasmides 


WO 97/36003 


PCT/FR97/00518 


17 

contenant, soit le fragment Fl, soit le fragment F2. La revelation de Hybridation par 
"southern-blot" est effectuee a 1'aide du kit ECL d'Amersham. Les bandes 
d'hybridation sont obtenues par marquage avec la peroxydase et revelation par 
chimiluminescence. 

5 La Figure l annexee donne les resultats obtenus. La colonne A correspond aux 
produits de la digestion par EcdRl de 1'ADN de Candida krusei non hybride avec une 
sonde. La colonne B correspond a i'hybridation avec une sonde comprenant des 
fragments Fl et F2. La colonne C correspond a une hybridation avec une sonde 
plasmidique contenant Fl et la colonne D a I'hybridation avec une sonde plasmidique 

10 contenant F2. 

Les poids moleculaires estimes des quatre bandes d'hybridation des colonnes B, C, D 
sont donnees en kilobase (kb) en marge gauche. 

1.3. S6quenpage deFl 

15 Fl est sequence dans son int6gralite dans les deux directions. La methode utilisee 
pour ce sequence est une methode classique dans le domaine technique considere. II 
s'agit de la methode par les terminaisons DIDEOXY utilisant la sequenase version 2.0. 
(US biochemical, Cleveland OH). Les moyens utilises sont le kit ERASE-A-base 
(Promega - Madison, Wl). 

20 La Figure 2 montre de maniere schematique la localisation du fragment Fl dans le 
cistron d'ADN ribosomal de LMCK 3 1 . 

La Figure 3 annexee donne la carte de restriction du fragment Fl. Les abbreviations 
utilisees pour les enzymes de restriction ont les significations suivantes : E = EcoKL 
(0,5261), Ev = £coRV (1803), H = Hind (229, 1 155; 1551, 4828, 4864), N = Nsil 
25 (401, 4383), P - Pstl (2183), S = Smal (803); St - Styl (2425, 2589, 2754, 2919, 
3084, 3249, 3414). 

La Figure 4 annexee donne la strategic de sequen?age adoptee. Dans cette Figure'4, les 

chifires encercles 1, 2, 3 correspondent a des sous-clones produits de deletions. 

Les chiffres donnes entre parentheses apres les enzymes correspondent au numero de 

30 base nucleotidique identifiant le site de coupure. 

D apparaJt done que Fl est une macro-sequence comprenant 5261 paires de base et 
ayant un taux en bases GC de 42,2 % molaire. La sequence complete de Fl est 
donnee par SEQ ID NO : 1 : dans la liste de sequence annexee. Fl comprend : 
488 paires de base sur Textremite 3* de VADNr 25 S, 

35 la region d'espacement intergenique 1 (IGR,), 

I'ADNr 5 S 
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et la region d'espacement intergenique 2 (IGRj). 
Comme, cela ressort des Figures 2 et 3, 1'1GR 2 (ou NTS = sequence non transcrite) 
comprend deux sequences sources iteratives Fa et Fp. Tandis que 11GR, renferme les 
deux sequences-sources iteratives F7I et Fy2. 

5 

1.3.1. Fa 

La sequence-source iterative Fa a une longueur de 1256 paires de base, (base 2256 a 
base 3512). Fa est representee schematiquement sur la Figure 5. La Figure 6 et la SEQ 
ID NO : 2 : de la liste de sequences annexee, donnent le sequencage complet de Fa. 
10 Fa est constitue de 8 sous-sequences repetees designees par Kre-0 a Kre-7 
respectivement. Les 7 premieres sous-sequences repetees Kre-0 a Kre-6 ont une 
longueur variant entre 164 et 165 paires de base. La derniere sous-sequence Kre-7 
comporte 103 paires de bases (voir Figures 5 et 6). 

Le fragment d'ADN corresponds a Fa a une teneur en bases GC de 3 5 % molaire. 

15 

1.3.2. FB 

L'autre sequence-source iterative d'un fragment F susceptible d'entrer dans la 
constitution d'une sonde selon 1'invention, est compris dans l'IGR 2 et designe par la 
reference Fp\ Le sequencage de Fp est represent* sur la Figure 7A et sur la SEQ ID : 

20 NO • 3 • de la liste de sequences annexee. La sequence-source FP comprend 9 sous- 
sequences repetees comprises entre la base 4823 et la base 4903. Ces sous-sequences 
ont une longueur variable entre 8 et 10 bases. Elles contiennent un noyau commun de 
6 bases constituant un motif commun (reference sur la Fig. 7A par Com 1), repete 
soit directement (les uns a la suite des autres) soit en etant separes par des 

25 espacements de quelques bases nucleotidiques. 

f.3.3. Fvl etFYl 

Ces deux sequences-sources iteratives F Y 1 et Fy2 sont localises dans HGR,. F7I 
comprend 9 sous-sequences repetees de longueur variant entre 6 et 16 bases, ces 

30 sous-sequences s'etalant de la base 923 a la base 101 1 (Figure 7B). F 7 2 s'etend de la 
base 1012 a la base 1151 et comporte 9 sous-sequences de longueur variant entre 10 
et 17 bases (Figure 7Q. Les sous-sequences de Fy2 sont des copies tres proches les 
unes des autres. Deux noyaux aux motifs communs de 6 et 7 bases peuvent etre isoles 
respectivement dans F7I et Fyl Les motifs communs de F7I et Fy2 sont idennfies par 

35 Com 2 et Com 3 sur les Figures 7B et 7C respectivement. 
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A l'instar de Com 1 de F 7 , Com 2 et Com 3 sont repetes soil directement (les uns a la 
suite des autres) soit en etant separes par des espacements de quelques bases 
nucleotidiques. 


5 EXEMPLE 


10 


15 


2 : ETUDE DE L'HOMOLOGIE ENTRE LES HUH SOUS-SEQUENCES DE Fa 


L'homologie des sous-sequences Kre-0 a Kre-7 a ete etudie en comportant les sous- 
sequences apres alignement optimal. 
Les resultats obtenus sont donnes dans le tableau I qui suit : 


TABLEAU I 


POURCENTAGE DE BASES QUI "AILMENT" OU QUI CORRESPONDENT ENTRE LES 8 
SOUS-SEQUENCES Kre-0 A Kre- 7 


% de bases correspond 

antes fno. des bases differentes) 


Sequence 
s 

Kie-0 

Kre-l 

Kre-2 

Kre-3 

Kre-4 

Kre-5 

Kre-6 

Kre-7* 

kre-0 

100 








Kre-1 

71 (47) 

100 







Kre-2 

77(39) 

95(9) 

100 






Kre-3 

77(39) 

95(9) 

100 

100 





Kre-4 

77(39) 

95(9) 

100 

100 

100 




Kre-5 

67(56) 

90(17) 

93(11) 

93(11) 

93(11) 

100 



Kre-6 

71(47) 

96(6) 

94(10) 

94(10) 

94(10) 

91(12) 

100 


Kre-7* 

66 (35) 

88(12) 

96(4) 

96(4) 

96(4) 

97(3) 

90(10) 

100 


* Les 103 bases de Kre-7 ont ete comparees avec les 103 premieres bases de Kre-n 
20 0 a 6. 
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EXEMPLE 3 • HYBRIDATION DE CHROMOSOMES DE CANDIDA KRUSEI ET DE CANDIDA 
ALBICANS AVEC DES SONDES COMPRENANT LES FRAGMENTS Fl OUFaETF[50U F 7 1, 

F72 

Cet exemple vise a demontrer que la localisation des fragments Fl, Fa, FP F7I et Fy2 
constituant la sonde selon Invention est seulement sur les chromosomes contenant 
des cistrons d l AKNr. 

3.1. Les souches mises en oeuvre sont LMCK31 pour Candida krusei et la 
souche 3 1 53 A pour Candida albicans. 

3.2. Les fragments Fl, Fa, Fp F7I et Fy2 mis en oeuvre sont ceux isoles dans 
les Exemples 1 et 2. 

3 3 La technique mise en oeuvre est celle d'electrophorese transversale a 
1 5 champ pulse. Des plaques d'agarose contenant I'ADN chromosomique sont preparees 
a partir de suspensions de culture de souche C. krusei LMCK 31 et C. albicans 31 
53A Les cellules sont converges en spheroplastes par la methode de shareman et al, 
selon laquelle on met en oeuvre la ZYMOLYASE 20 T. Les spheroplastes sont tout 
d'abord laves deux fois dans une solution de sorbitol molaire puis remis en suspension 
20 a raison de 10' cellules/ml. Les spheroplastes sont melangees avec un volume - 
d'agarose seaplaque GT a 1 % (FMC bioproducts, Rockland ME) et immed.atement 
verse dans un moule. Les plaques sont traitees avec du SARCOSYL a 1% et avec une 
proteinase K titrant 100 mg/ml et enfin incube a 50» pendant 60 heures. Les plaques 
sont ensuite lavees dans une solution tampon TE (10 mM tris-HCL), ph 8, ImM 
25 EDTA) et stockee dans ce milieu a 4° C. Les ADN chromosomiques sont separes par 
electrophone sur gel 4 champ pulse dans un dispositif Gene Une (BECKMAN, 
FULLERTON, CA) en utiltsant de l'agarose LE 0.65 % (FMC bioproducts, Rockland 
me) ainsi qu'un tampon tris - acetate 0,04 M tris acetate, 0,001 M EDTA P H8). 
L'electrophorese est menee selon les cinq etapes telles que decrites ci-apres : 65 V 
30 pendant 6 heures avec une duree de commutation dMne minute ; 65 V pendant 12 
heures avec une duree de commutation de 2 mn ; 65 V pendant 16 heures avec une 
duree de commutation de 4 mn ; 65 V pendant 20 heures avec une duree de 
commutation de 7 mn et 65 V pendant 18 heures avec une duree de commutation de 
10 mn Les gels sont ensuite reveles avec du bromure d'ethidium, photographies pu,s 
35 transfer* sur une membrane de nylon ZETABIND. Lhybridation et le lavage sont 
realises selon la methodologie de CHURCH et GILBERT. Les bandes 
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chromosomiques sont sondees avec les differentes sondes marquees radioactivement : 
Fl, Fa et Fp F7I et Tyl, selon la methode ^hybridation sur membrane. 

3.4. Resultats 

5 La Figure 8A montre les gels d'electrophorese a champ pulse qui montre que Ton a 
separe 5 chromosomes majeurs pour Candida krusei et 7 chromosomes majeurs pour 
Candida albicans. 

La Figure 8 B montre que les sondes Fl, Fa et F|J, F7I et F72 hybrident uniquement 
avec les trois plus gros chromosomes 1, 2, 3 de Candida krusei. Les sondes 
10 n'hybrident avec aucun des 7 chromosomes de Candida albicans. Ce qui demontre la 
specificite inter-especes desdites sondes. La Figure 8A montre egalement un 
minichromosome m (pour Candida krusei). 

La Figure 8 montre une hybridation sur membrane dans Iaquelle les sondes ont ete 
mises en contact avec des chromosomes pendant 4 jours. 
15 Le code P sur les Figures 8A a 8B correspond a la zone de depot de rechantillon. 

EXEMPLE 4 : TEST DE DETECTION ET DlDENTIFIC AT10N ENTRE ESPECES 

La Figure 9A montre le gel d'electrophorese de I'ADN de souches de differentes 
20 especes de levures, digere par l l enzyme EcoKL. La Figure 9B montre Thybridation selon 
Southern correspondante lorsque les sondes Fl, Fa et F[J, F7I et F?2 sont utilisees, 
en etant marquees a la peroxydase. Le protocole experimental est le meme que celui 
decrit decrit dans TExemple 1 supra ainsi que dans rExemple 3 du WO-9S/11991. Les 
sondes hybrident uniquement avec l'ADN de C. krusei (CBS 573T, bande n° 10) et 
25 pas avec l'ADN des autres levures testees. Ceci d&nontre la specificite interespece 
desdites sequences. 

Dans les essais correspondant aux Fig. 9A et 9B, les microorganismes consideres sont 
les suivants ; 

30 S : Standard : Phage lambda digere par HindUl 

1 : C tropicalis CBS 94T 

2 : C. parapsilosis CBS 604T 

3 : C guilliermondii CBS 602 IT 

4 : C lusitaniae CBS 6936T 
35 5 : C *e£r CBS 607T 

6 : C. albicans serotype B 
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7 : C. albicans serotype A 
8: C. Albicans ATCC 2091 

9 : C. vflfcfcCBS 63 8T 

10 : C JTrttsei CBS 573 T 

11 : Y. lipolytica CBS 6124 T 

S : Standard : Phase lambda digere par Hindm 
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EXEMPLE 5 : TEST DE TYPAGE INFRA-SPECIFIQUE POUR DIFFERENTES SOUCHES DE C. 
Krusei 

La Flp.™ 10A tnontre le gel d'electrophorese de 1'ADN de plusieurs souches de 
1-espece C. Krusei, digere pour 1'enzyme EcoKI. La Figure 10B montre 1'hybndat.on 
selon Southern correspondante lorsque les sondes Fl, Fa et F& F 7 1 et Fy2 sont 
utilisees, marquees a la peroxydase. Le protocole experimental est le meme que celu. 
decrit dans VExemple 1 supra, (ou Exemple 3 du WO 95/11991). Les sondes hybndent 
avec toutes les souches de C. krusei testees, ce qui illustre leur mteret pour la 
detection et Identification de cette espece. En outre, ces sondes revelent un 
polymorphisme de la taille des fragments de restriction selon les sondes. Cea iUustre 
Lteret de ces sondes pour differencier les souches entre-elles au ruveau 
infraspecifique et done pour le typage des souches dans le cadre d'etudes 
epiderniologiques ou le tracage des souches en milieu Industrie!. Toujours a utre 
d'exemple les souches referencees K62-K64 dont les profils d'hybridafon sont 
identiques, proviennent d'un meme patient. 


25 


30 
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EXEMPLE 6 : TEST DtDENTTFICATlON ET TYPAGE DE SOUCHES DE C .MSB _PAR 
REACTION DE POLYMERISATION EN CHAINE (PCR) DE LA REGION Fa (OU CKRS-1 ) 

La figure 11 montre le result* de Vamplification selective (selon la methode PCR) de 
la region Fa (CKRS-1) a l'aide des amorces Arnol • 
CGTAGGATACTAACCACAGC et Amo 2 : GGCCAACACATACATACCTT dont 
les sequences sont choisies dans le fragment Fl de C. krusei (positions 2138-2167 et 
3989-3970) Les conditions d'amplification sont celles decrites par Carlotu et al. 
1994 Systematic and Applied Microbiology 17, 380-386. La procedure 
d'ampHfication par PCR est la suivante 50 ul de la solution d'ADN a tester (ADN de 
C. krusei et ADNs d'autres especes de levures) contenant environ 10 a 100 PS sont 
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ajoutes a 50 ul du melange reactionnel contenant la Taq polymerase dans un tube 
eppendorf et place sur un thermocycleur. La denaturation initiale dure 3 minutes a 
92° C. Elle est suivie de 30 cycles constitues de : 1 minute a 92°C, 1 minute a 60°C, 2 
minutes a 72° C. L'extension finale dure 10 minutes a 72° C. 
5 Les differentes souches testees dans cet exemple sont designes par les references R, 
12 a 26 sur la Figure 11. La legende de ces references est donne ci-apres : 

R : Raoul 

12 : C. krusei CBS 573T 

13 :C. A7aje/LMCK31 
14 : controle Negatif 

15 : S. cerevisiae CBS 1171 

16 : C. albicans ATCC 2091 

17 : C. norvegensis LM Q243 

18 : C. glabrata CBS 138T 
19: Y. lipolytica CBS 6124T 

20 :C. te>-CBS607T 

21 : C. lusitaniae CBS 693 6T 

22 : C. guilliermondii CBS 602 IT 

23 : C. parapsilosis CBS 604T 

24 : C. rugosa SIPH 

25 : C valida CBS 638T 

26 : C. inconspicua CBS 180T 

25 Du fait de la specificity de la region (CKRS-1) cible et des amorces choisies, seuls les 
ADNs des souches de C. krusei (ref. 12, 13) ont donn6 un signal d'amplification 
positif (Figure 11). Les ADNs des autres especes de levures testees n'ont pas &6 
amplifies. En outre, les differences de la taille des fragments amplifies chez les deux 
souches de C. krusei testees traduisent le polymorphisme de la region Fo(CKRS-l). 

30 Cet exemple illustre bien Hnteret de tests d'amplification par PCR de la region Fa 
(CKRS-1) pour l'identification des souches de C. krusei et pour leur typage simultane. 
Cette methodologie presente l'avantage d'etre tres rapide et utilisable directement sur 
les prelevements biologiques (crachats, sang, selles, LCR) ou alimentaires. 
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EXEMPLE 7 : TEST DE DETECTION, D'IDENTIFICATION-TYPAGE DES LEVURES DE 
L'ESPECE Geotrichum candidum 

7.1. L'isolement et le clonage du Fragment F.o comprenant F8 compris dans la sonde 
AjOj, developpee pour Geotrichum candidum, ont ete realises conformement au 
protocole decrit a l'exemple 1 supra. 

La Figure 12 donne la carte de restriction du fragment F10 comprenant la sequence- 
source iterative F8 (GCRS-1). 
Abreviations : EV = EcoRV, SU = Sacll, EI = EcoKl. 


10 


7.2. Test de detection/identification 

La Figure 13 montre les resultats dTiybridation, selon la methode de Southern, de 
l'ADN de souches des especes Geotrichum candidum et Geotrichum fermentans 
(diger6s par Mspl) avec la sonde A 2 0 27 specifique de Geotrichum candidum. Us 
15 fragments de restriction par Mspl de l'ADN des souches etudiees ont ete separes par 
electrophorese en gel d'agarose a 0,8 % puis transferes sur membrane en nylon. La 
membrane a ete sondee avec environ 100 ng de la sonde AA ? . Cette sonde n'hybnde 
qu'avec l'ADN des souches de Geotrichum candidum et revele un polymorphisme de 
la taille des fragments de restriction. 
20 La sonde A 2 0„ a ete developpee selon le modele de la sonde F = F 1 , Fa, Fp\ F7I , 

F72. La sonde A 2 0 27 est constituee d'une partie F I0 dont F5 de 1'IGR, d'une souche de 
Geotrichum candidum. La sonde AA, hybride uniquement avec l'ADN des souches 
de Geotrichum candidum (Fig. 13). Elle n'hybnde pas avec l'ADN des souches de 

Geotrichum fermentans, bien que ces deux especes soient proches. Cet exemple 
25 montre bien la specified de cette sonde selon Invention. De plus, cette sonde revele 

egalement un polymorphisme de la taille des fragments de restriction selon les souches 

de Geotrichum candidum. Ceci permet de les differencier entre-elles et done de les 

typer. 

Cet exemple illustre la validite du modele presente de sonde d'identificauon-typage 
3 0 pour les levures d'interet medical et/ou d'interet industriel. 

Les souches referencees sur la Figure 13, N° 27 a 37 correspondant a : 
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S = Standard 
G.fermentans CBS 50.57 
G.fermentans CBS 25.29 
G. candidum F 
5 G. candidum A 
G. candidum B 
G. candidum LMGC3 
G. fermentans 
G. candidum 149.26 
1 0 G. candidum LMGC8 
G. candidum LMGC7 
G. candidum CBS 557.83 
Standard 


15 


WO 97/36003 


26 


PCT7FR97/00518 


LISTE DE SEQUENCES 


( 1) -INFORMATIONS GEKERALES : 


(i) DEPOSANT: 

(A) NOM: Universite Claude Bernard Lyon I 

(B) RUE: U3, Boulevard du 11 Novembre 1918 
<C) VILLE: Villeurbanne 

(E) PAYS: France 

(F) CODE POSTAL: 69622 Cedex 

(ii) TITRE DE L' INVENTION: Sonde et procede notamnent pour la 

detection et/ou 1' identification inter/infraspecifique de 
levures. de meme que les outils jenetiques correspondents 


(iii) NOMBRE DE SEQUENCES: 5 

(iw) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0. Version #1.30 (OEB) 

(vi) DONNEES DE LA DEMANDE ANTERIEURE: 

(A) NUMERO DE LA DEMANDE: FR 96 03835 

(B) DATE DE DEPOT: 22-MAR-1996 


(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 5261 paires de bases 

(B) TYPE: nuclotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 


(ii) TYPE DE MOLECULE: ADN (genomique) 


(iii) HYPOTHETIQUE: NON 


(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

GAATTCGGTA AGCGTTGGAT TGTTCACCCA CTAATACGGA ACGTGAGCTG GGTTTAGACC 
GTCGTGAGAC AGGTTAGTTT TACCCTACTG ATGAATGTTG TCGCAATAGT AATTGAACTT 
AGTACGAGAG GAACCGTTCA TTCAGATAAT TGGTTTTTGC GGCTGTCTGA GCAGACACTG 
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CCGCGACGCT ACCATCTGCT GGATAATGGC TGAACGCCTC TAAGTCAGAA TCCATGCTAG 240 

AACGCGACGA TTACCTGCCC TCGCACATTT GAGAAGGATA CGAATAAGGC CCTGTGGCCG 300 

CAGAACCGTA GCAGGCCGGC AGCGGTGCGC ATGGCGGAAA GGCCGTGTGT GCTTGCCGGC 360 

GGATGGCAAT GTCAGGATGC GCTCAGATAA ATCCTATGCA TACGACTTAG ATGTACAACG 420 

GGGTATTGTA AGCAGTAGAG TAGCCTTGTT GTTACGATCT GCTGAGATTA AGCCTCTGTT 480 

GTCCGATTTG TTGCTTCGGC GGCGAAGGAG CGGTCCGTAG AGACGGGCTG TTGTTTCGGG 5^0 

AGTGTGGGGA GTGTGGGGGG ACTTAGGAGC GGGGGTAGTG TGGGGGAGTG TGGGGACTTG 600 

GGAGCGGGNG TAGTAGGTGG TACTGATGGT ACGGGGAGGA GCCTACCCTT TT7TGTCGTT 660 

TTGGCAAAGA CATTGCAGGA TTTACAAAGT GATTTACGAT ATGAACTAGG ACTATGTTGT 720 

GTGGAGGGGG TGGGGCTGTA GAGAGGATGG ATTTGACGGG CATGACGGGG ACGGCTTGGA 780 

GGCCGCCCAT GTCGTATGCC CCGGGGTAGG GTATAGGCCG GGAGGGGCCA GTTGGGAAAA 840 

TAGCGAAGAG GGGGGGAGGA GGCTAAGAAQ GCGGTGGGGG AGGGGGTAGG TKJATAAGTA 900 

GGGGGTGTAG GAGCGTGGGT GGAGTGGGAG TGGGAGTGGG TGGTACAGAG TGGGTGGTAC 960 

AGAGTGGGTG GTACAGAGTA CAGAGTGGGG AGAGTACAGA GTGGGAGTGG TAGGAGGAAG 1020 

AGACAGTACA CAGTAGGAGG AAGAGAGTGG TAGGAAGAGA GTGGTAGGAG GAAGAGCGGC 1080 

AGGAGGAAGA GAGTGGTAGG AGGAAGAGTG GTAGGAGGAA GAGTGGTAGG AAGAGAGTGG 1140 

TAGGAGGAAG ATGGAATCCT AGACCTTGTA AATTCAGACA AAACTCGGTC AAAAACTAGA 1200 

CAATGGGGGC AGTGCGGGAT TTTCGACAAC AAAAACAAAG GGAGGTAAAC AAAGGCAAAC 1260 

AAAGGTAAAC ACAAGAAAAA CAGGCAGCAC AGGCAGKAAA AAGATTGCAG CACCTGAGTT 1320 

TCGCATATGG TCTCCCACTA CACTACTCGG TCAGGCTCTT AGCAGCTTAA CTACAGTTGA 1380 

TCGGACGGTA AACGGTGCTT TCTGCTAGAT ATGGCCGCAA CCGAAAGTAT AGAACGGGCG 1440 

GCGTATGGGA GGnTGATTT TGGGCGGGCA GATTTCGACG GGTCGATAAA TCTCGACGGG 1500 

ACGCATGTTT GCAGGGCCAT AGCAGACGAA CCAGAGCAGC TGAACAGGCG AGTCAACCAC 1560 

CGTTGGAAAG AGCGCCGAGA AGTATCTAGT CCCCCCCATC GGTGTGGCCA TAGGACGCAA 1620 

TCGGCAACAT GGCCAAAATC AAAAAACAAA AATTCCCACT TTTACAAAAT ATATATAATT 1680 

TACAAAAAAT AGGTCTGGCA AAAATGCAAT TTTGGAAAAA AATCGAGTAA AAAGTAAATA 1740 

TTATGGGCGG AACGGATAGC CGTCGACGCG ACGATGGTGA AAACCGTGGT TGGAAAGCCG 1800 

ATATCGGGCC TGGGCGGAGA AAACOGCGAA AAGACAACTC CGAACACGAC ATTTCGGCAA i860 

TGTTGCTGTT TCGGCAAAGT CCGAGGCGAA GTCCGAGGCG TAACTCCGAT GGGCGGAGAT 1920 

AAAGTGCGCA CGTGACTGGT GCGAGGGGTG GGGCGTTCTG GAGCGACGCA AAAAAAAAAA 1980 

CACGCACAAA AAAAATGGAC GTCGAGAAAA AAAAATTTAC ACGAGCGAGC ACTAAGGTGG 2040 

GAATGGACGT CCCCAGAAAT GTCTTCCACT TTGCCACCAC TTTTTCTTTT GCACACTTCT 2100 

GCTGTATGTC TGTCTGCACC ACCTCTTCCA CAACCAAGCA CACCACAGGT AGGATACTAA 2160 

CCACAGCAGG GCTGTCTCTG CAGCCAACCA CCCAGCAGTT TCTTTTGATT TTGATTTTTT "2220 

TGATTTTNNT GATTTTTATT TTGACTGATT TTGCTTTTCC CTTGTGTAAA AGTCTCGTCG 2280 

ACATTGCAGC TGGATGCAAT GGGCGTTTCT GAACACCAAT CCACTTAGTT GGGTTGATTT 2340 

TTCTTACTGT CTGATGAAGA TATGATTGTT TTTTAAAATT CCATTTTTTT TGATTTTATA 2400 

TAACTTCACT GTOGGGTGGT TTCCCTTGGC CTGCAAGCTC ATACACATTA CAGTTCCATC 2460 

CATTGCACGT TTCTAAACAC TACTCCACTT AGTTGGGCTG TTTATTTCCA CATGCTGATG 2520 

AAATGGTTGC TGTTTTTCAG AATTTCAGTT TTTTGATTTT ATATAACTTC ACTTTGGAGA 258O 

TGATTTCCCT TGGACTTTAC AATCACACAC ATTACAGTTC CATCCATTGC ACGTTTCTAA 2640 

ACACTACTCC ACTTAGTTGG GCTATTTATT TCCACATGCT GATGAAATGG TTGCTGTTTT 2700 

TCAGAATTTC AGTTTTTTTG ATTTTATATA ACTTCACTTT GGAGATGATT TCCCTTGGAC 2760 

TTTACAATCA CACACATTAC ACTTCCATCC ATTGCACGTT TCTAAACACT ACTCCACTTA 2820 

GTTGGGCTAT TTATTTCCAC ATGCTGATGA AATGGTTGCT GTTTTTCAGA ATTTCAGnT 2880 
TTTTGAnTT ATATAACTTC ACTTTGGAGA TGATTTCCCT TGGACTTTAC AATCACACAC 2940 
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AITACAGTrC CATCCATTGC ACGTTTCTAA ACACTACTCC ACTTAGTTGG GCTATTTATT 3000 

TCCACATGCT GATGAAATGG TTGCTGTTTT TCAGAATTTC AGTl'l'l'I'l'lG ATTTTATATA 3060 

ACTTCACTTT GGAGATGATT TCCCTTGGAC TTTACAATCA CACACATTAC AGTTCCATCC 3120 

A1TGCACGTT TCTAAACACT ACTCCACTTA GTTGGGCTGT TTATTTCCAC AGGTTGATGA 3180 

AATGGTTGCT GTTTTTCAGA ATTTCAGTTT TTACAATTTC AACTAGTTTC ACTTTGGAGA 3240 

TGATTTCCCT TGGCATGGAA GCTCACACAC ATTACAGTTC CATCCATTGC ACGTTTCTAA 3300 

ACACTACTCC ACTTAGTTGG GCTGTTTATT TCCACAGGTT GATGAAATGG TTGCTGTTTT 3360 

TCAGAATTTC AGTTTTTTTG ATTTTATATA ACTTCACTTT GGAGATGATT TCCCTTGGAC 3^20 

TTTACAATCA CACACATTAC AGTTCCATCA ATTACACGTT TCTAAACACT ACTCCACTTA 3480 

GTTGGGCTAT TTATTTCCAC AGGTTGATGA AGTTGTCAAG TTTTACAATT TTGGTTGCTG 3540 

AAGGTTCGGC AATTCACTGT TGTATAATTG AACGACAGAC ACTTCAATCA GCACTCTGCT 3600 

TCCCTTTTAT GTATTCTCCA ACGTAGTATC TTGACAAAGT ATATATATGA CTGCCACTTT 3660 

GATTATTTTQ ATAGCTTTGT ATTTGACCAC TAATTTTGTA TTTGACCACC AATTTGAAAA 3720 

TGCCAATACC AATTTGCATT TGCCAGGGAA TTTCAATACC AATTTGCATT GCCAGGGAAT 3780 

TTCAATACCA ATTTCCAGGA ATTTCAATAC TAATTACCAC CATTTCCAGG AATTAATTTC 3840 

GTCGAAAAAT TAAAAAAGNC GTCGAGAAAT TTTCTGTTTG TTTTGCAAAC AAAATATCAC 3900 

ACACAACACT GAATACACGG MGTTCTGTT GGACACAGAG CCCCACACAC ACAACGTACA 3960 

TGCAATTGGA AGGTATGTAT GTCTTGGCCA GGAGCAGGCQ CAACTGTGCC (nCCTCCTTG 4020 

TGCATAATAC AGCGGCGTAC CGACAGAAAT AGAGCCCCCC AAAATTTGAT GGAAAAATAG 4080 

TGGACAGTTG GACTTTGCAA GTTGGACGCA GTGGAATAGA CAACCAAACA CCCCGATTAA 4l40 

CAAGCCGATG GCCGATTGAC CCAATGCCAA TCAGTATGGA TCGATAACTG TCCAACTGAA 4200 

CGAGTAACAA GAAGATGTTT TCCAAATGTC AGAATTTCAA ATCGGATGTT CCACTGATGG 4260 

TCTGGGCGTT GCAGTCTGGG CTCCAGGTGT GTCAACTGGA CATTGCCAAG CGTGCACCGA 4320 

TGTTGCAAGA CGATTACCAC GGCAACAAAC CGGTGTTTAC GACAAGAACA CTGGCAGATG 4380 

CATCGAATAC TGATTTGGTG CAATTTCAAG GTTTGGGAGT TTTGTATAAT GTGTGTATAT 4440 

TATGATGCGA CAACATGCGC CGGTGTGTAA ATAGTGTATT GCAACCTGTA A ATAAACTA A 4500 

ATCGACAAGG AATTGGTGGA ATTAGACGTA AAATAGTGTT GGCGAAAATA CGTTTTTTGT 4560 

TTCTGGGGGA CCTATGACGA TACTTTTTGG ACGCACATGT GGAGCGGCAT GAAATTAGTG 4620 

TGTGGCCGAG TTTGGGAGGA TATTCCCCAG GCGGTTGCCA AGATATTTGA AATAATCTGA 4680 

ATTTCAAAAA TGTCGGTGCT CTTTCGAAAT GCCATGTCCA GAGGATTTGA AATTnTGGA 4740 

TGGAGCTGTG TTGGCTGGGT TGATGTTAAG GGAATGATAT ATCTGCGCTT TTCAATGTAT 4800 

TATGTTTCAG ATTTTTTGAG ATTTTTGAAT CTTTGAATTT TTTGAAATCT TTTGAATTTT 4860 

TTGAATCTTT TGAATTTTTT GAAATCTTTT GAATTTTTTT CAAAGTCTAT AAATGTTATT 4920 

GTGTITrTGG TTTTATTTTA GCTTTTGCAA AATGTTATTT CATTATACAG TTCAAAATAA 4980 

TTTAATTGCC TATATGTTTT ACAATATAAT ATATTTTATT TCAGATTTCA AAATAATTTT 5040 

TTCCATTAAA CGTTTATAAT ACATTATTTT ACTTCAGATT TCAGGATATA CTATTCATTC 5100 

CCACACTTTA AAATATATTA TTCAATTTCA CACACCAAAG TGTACTATTT AACTTCACAT 5160 

TTCAAAATAA AATATTTGAC AATACCTAAA TATGGCATTT TTATTTCGGA TTTCGTTAGA 5220 

TATTCTTTAG TTATACAATC CCAAACATGC TATTCGAATT C 5261 


(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1257 paires de bases 

(B) TYPE: nucleotide 

(C) NOHBRE DE BR INS : simple 


WO 97/36003 


29 


PCT/FR97/00518 


(D) CONFIGURATION : - lineaire 
--(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

TTTCCCTTGT GTAAAAGTCT CGTCGACATT GCAGCTGGAT GCAATGGGCG TTTCTGAACA 60 

CCAATCCACT TAGTTGGGTT GATTTTTCTT ACTGTCTGAT GAAGATATGA TTGTTTTTTA 120 

AAATTCCATT TTTTTTGATT TTATATAACT TCACTGTCGG GTGGTTTCCC TTGGCCTGCA 180 

AGCTCATACA CATTACAGTT CCATCCATTG CACGTTTCTA AACACTACTC CACTTACTTG 240 

GGCTGTTTAT TTCCACATGC TGATGAAATG GTTGCTGTTT TTCAGAATTT CACTTTTTTG 300 

ATTTTATATA ACTTCACTTT GGAGATGATT TCCCTTGGAC TTTACAATCA CACACATTAC 360 

AGTTCCATCC ATTGCACGTT TCTAAACACT ACTCCACTTA GTTGGGCTAT TTATTTCCAC 420 

ATGCTGATGA AATGGTTGCT GTTTTTCAGA ATTTCAGTTT TTTTGATTTT ATATAACTTC 480 

ACTTTGGAGA TGATTTCCCT TGGACTTTAC AATCACACAC ATTACAGTTC CATCCATTGC 540 

ACGTTTCTAA ACACTACTCC ACTTAGTTGG GCTATTTATT TCCACATGCT GATGAAATGG 600 

TTGCTGTTTT TCAGAATTTC ACTTTTTTTG ATTTTATATA ACTTCACTTT GGAGATGATT 660 

TCCCTTGGAC TTTACAATCA CACACATTAC AGTTCCATCC ATTGCACGTT TCTAAAC ACT 720 

ACTCCACTTA GTTGGGCTAT TTATTTCCAC ATGCTGATGA AATGGTTGCT GTTTTTCAGA 780 

ATTTCAGTTT TTTTGATTTT ATATAACTTC ACTTTGGAGA TGATTTCCCT TGGACTTTAC 840 

AATCACACAC ATTACAGTTC CATCCATTGC ACGTTTCTAA ACACTACTCC A CTTAGTT GG 900 

GCTGTTTATT TCCACAGGTT GATGAAATGG TTGCTGTTTT TCAGAATTTC AGTTTTTACA 960 

ATTTCAACTA GTTTCACTTT GGAGATGATT TCCCTTGGCA TGGAAGCTCA CACACATTAC 1020 

AGTTCCATCC ATTGCACGTT TCTAAACACT ACTCCACTTA GTTGGGCTGT TTATTTCCAC 1080 

AGGTTGATGA AATGGTTGCT GTTTTTCAGA ATTTCAGTTT TTTTGATTTT ATATAACTTC 1140 

ACTTTGGAGA TGATTTCCCT TGGACTTTAC AATCACACAC ATTACAGTTC CATCAATTAC 1200 

ACGTTTCTAA ACACTACTCC ACTTAGTTGG GCTATTTATT TCCACAGGTT GATGAAG 1257 

(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 8l paires de bases 

(B) TYPE: nucleotide 

(C) NOHBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 


(iv) ANTI-SENS: NON 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3 = 

TTTTGAATCT TTGAATTTTT TGAAATCTTT TGAATTTTTT GAATCTTTTG AATTTTTTGA 
AATCTTTTGA ATTTTTTTCA A 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 89 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
{iii) HYPOTHETIQUE: NON 

(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: *»: 

AGTGGGAGTG GGAGTGGGTG GTACAGAGTG GGTGGTACAG AGTGGGTGGT ACAGAGTACA 
GAGTGGGGAG AGTACAGAGT GGGAGTGGT 

(2) INFORMATIONS POUR LA SEQ ID NO: 5- 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 140 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 


AGGAGGAAGA GACAGTACAC AGTAGGAGGA AGAGAGTGGT AGGAAGAGAG TGGTAGGAGG 
AAGACCGGCA GGAGGAAGAG AGTGGTAGGA GGAAGAGTGG TAGGAGGAAG AGTGGTAGGA 
AGAGAGTGGT AGGAGGAAGA 


60 
120 
1^0 
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REVINDICATIONS : 

l - Sonde, notamment, de detection specifique et/ou intraspecifique de levures, 
du type de celle choisie parmi les outils genetiques (ou apparentes) suivants : 
• au moins une parti e ; 
5 * d'au moins un fragment F d'acide nucleique ADN et/ou 

ARN recopie, constant et/ou isole a partir d'au moins 
une sequence-source d'ADN ribosomal (ADNr) 

ne codant pas pour la synthese d'ARN ribosomal 
(ARNr), 

10 et localisee dans la region d'espacement 

intergenique (IGR) non transcrite (NTS) et 
comprise entre l'ADNr codant pour la sous-unite 
25 S d'ARNr, et FADNr codant pour la sous- 
unite 18 S d'ARNr, 

2 5 * et/ou d'au moins un analogue Fa de ce fragment, 

resultant de la degenerescence du code genetique ; 
* et/ou d'au moins un fragment Fc d'ADNc 
complementaire du fragment F, 

- au moins une partie des produits de transcription primaire du 
20 fragment F et/ou Fa et/ou Fc. 

- et une association des outils enumeres ci-dessus. 

caracterise en ce que la sequence-source d'ADNr pour F et/ou Fa 
et/ou Fc est selectionnee de telle sorte 

> qu'elle soit iterative 

25 > qu'elle comprenne au moins 2, de preference de 

2 a 12 sous-sequences r6petees, 

> et que le degre d'homologie entre ces sous- 
sequences soit superieur ou egal a 50 %, de 
preference 55 %, et plus preferentiellement 

3Q encore a 60 %. 

2 - Sonde selon la revendication 1, caracterisee en ce que la sequence-source de 
F est localisee dans la region d'espacement intergenique 2 (IGR 2 ) non transcrite 
(NTS) et comprise entre l'ADNr codant pour la sous-unite 5S d'ARNr et l'ADNr 
codant pour la sous-unite 18 S d'ARNr. 

35 3 - Sonde selon la revendication 1 ou 2, caracterisee en ce que la sequence- 

source iterative de F correspond a une sequence Fa et comprend au moins trois sous- 
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sequences repetees comportant chacune au moins 80, de preference au moms 120 et 
plus preferentieUement encore entre 150 et 300 bases nucleotuhques. 

4 - Sonde sebn l'une quelconque des revendications 1 a 3, caractensee en ce 
que la sequence-source iterative de F comprend au moins une sous-sequence de 
longueur tronquee par rapport aux autres sous-sequences, cette sous-sequence 
tronquee etant de preference terminale. 

5 - Sonde selon la revendication 1 ou 2, caractensee en ce que la sequence- 
source iterative de F correspond a une sequence FP et comprend au moins tro,s sous- 
sequences repetees comportant chacune au moins 4, de preference au moms 6 et, plus 

, preferentieUement encore entre 7 et 25 bases nucleotidiques , chaque sous-sequence 
comprenant au moins un motif commun (Com 1) a toutes les sous-sequences et ayant 
une longueur inferieure ou egale a cdle de la sous-sequence a laquelle u apparent. 

6 - Sonde selon la revendication 1, caracterisee en ce que la sequence-source 

5 ' . est localisee dans la region d'espacement intergenique 1 (IGR.) non 

transcrite (NTS) et comprise entre l'ADNr codant pour la sous-unite 5S d'ARNr et 
V ADNr codant pour la sous-unite 25 S d'ARNr 

et correspond a au moins une sequence F 7 et comprend au moms tro.s 
sous-sequences repetees comportant chacune au moins 4, de preference au moms 5 
0 et plus preferentieUement encore entre 5 et 50, voire entre 5 et 45, et nueux encore 
entre 5 et 40 bases nucleotidiques, chaque sous-sequence comprenant au moins un 
motif commun (Com 2 ou 3) a toutes les sous-sequences et ayant une longueur 
inferieure ou egale a celle de la sous-sequence a laquelle il apparent. 

un cas de figure particuUerement prefere etant celui dans lequel F correspond a 
» au moins deux sequences F Y : F 7l et Ffe ayant respectivement avantageusement de 5 a 
20 et de 9 4 25 bases nucleotidiciues. 

7 . Sequence d'ADN caractensee en ce qu'eUe est choisie dans le groupe des 
fences annexees suivantes : SEQ ID NO : ! ; SEQ ©NO : 2 : . SEQ ID NO : 
3 : ; SEQ ID NO : 4 : ; SEQ ID NO : 5 : ; les SEQ ID NO 2 : a : 5 : etan. 

30 particulierement preferes. , 

8 - Sonde selon au moins l'une des revendications 1 a6, caractensee en ce que 

Fa correspond a SEQ ID NO : 2 : 
Fp correspond a SEQ ID NO 3 : 
FY, correspond a SEQ ID NO : 4 : 
35 FY, correspond a SEQ ID NO: 5: 

9 - Sonde selon l'une quelconque des revendications 1 a 8, caracterisee : 
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en ce qu'elle comprend au moins une partie d'au moins Tun des 
fragments Fa, Fp, le fragment Fa etant particulierement 

prefere. 

en ce qu'elle est appliquee : 
5 > a la detection/identification specifique et infraspecifique de 

levures, 

> ou comme marqueur epidemiologique, 

> ou encore comme traceur de souche, 

> ou bien enfin dans le cadre d'une strategic therapeutique visant 
10 des affections a levures. 

10 - Precede de detection et ^identification de levures caracterise en ce qu'il 
consiste i mettre en oeuvre au moins une sonde selon Tune quelconque des 

revendications 1 a 6, 8 et 9. 

11 - Procede selon la revendication 10, caracterise en ce que : 

1 5 . 0 n extrait I'ADN total genomique des souches a etudier, 

- on soumet eventuellement cet ADN total a une digestion 
enzymatique a l'aide d'au moins une enzyme de restriction, 

- on denature I'ADN total eventuellement digere, 

- on met en presence I'ADN total ainsi denature, avec la sonde 
20 dotee d'au moins un marqueur, de fa^on a realiser 

Thybridation, 

- on elimine I'ADN et la sonde non hybridee, 

- et on revele rhybridation a l'aide du marqueur. 

12 - Amorce oligonucleotidique, utflisable notamment pour la reaction de 
25 polymerisation en chaine (PCR), caracterisee en ce qu'elle est constitute par la sonde 

selon rune quelconque des revendications 1 a 8. 

13 - Reactif de detection/identification de levures comprenant au moins une 
sonde selon Tune quelconque des revendications 1 a 8. 

14 - Application de la sonde selon l'une quelconque des revendications 1 a 6, 8 
30 et 9, pour la detection, Identification inter-especes et/ou la differenciation 

infraspecifique des levures notamment des especes Candida krusei ou Geotrichurn 
candidum. 
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*C*A* 


*TGT* 


5 1 TTTCTAAACACTACTCCACTTAGTTGGGCTGTTTATTTCCACATGCTGAT 

51 ********************** ********a******************* 
51 ********** ***************♦***•£**•**************** 

5! ****************************** *************G*T**** 
51 ****************** **********w* A ************G # T*** # 

«pall» 

101 ***GATA*GAT*******TAA**^^ 


101 GAAATGGTTGCTGTTTTTCAGAATTTCAGTTTTTT-GATri^ 
101 ***********************************T***^ 
****************#************ ***T*** 


101 
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101 **** ******** ** # *ACA***gl 
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